# 1、导包
from bs4 import BeautifulSoup

data = """
<html> 
    <head>
        <title>黑马程序员</title>
    </head> 
    <body>
        <p id="test01">软件测试</p>
        <p id="test02">2020年</p>
        <a href="/api.html">接口测试</a>
        <a href="/web.html">Web自动化测试</a> 
        <a href="/app.html">APP自动化测试</a>
</body>
</html>
"""
# 2、获取BeautifulSoup对象
bs = BeautifulSoup(data, "html.parser")
# 3、调用相关方法
# 获取title标签的全部数据
print(bs.title)
# # 获取title标签的内容
print(bs.title.string)
# # 获取p标签的第一条数据，id属性的值
print(bs.p.get("id"))
# 获取所有a标签
print(bs.findAll("a"))
# 获取所有a标签的href属性的值
# 定义一个列表,用来接收获取所有a标签的href属性的值
href_list = list()
# 要从所有a中读取每一个a标签的内容,for循环遍历
for a in bs.findAll("a"):
    href_c = a.get("href")
    # 用list的append方法
    href_list.append(href_c)
print("获取所有a标签的href属性的值:{}".format(href_list))
